#AI Agent

Y11
1个月前
高端招聘:阿里 招 AI Agent技术架构师(P7-P8) ----- 阿里控股-AI Agent技术架构师-杭州 阿里集团 · 杭州 职位描述 1、参与阿里巴巴控股集团企业经营智能化方向产品的研发和核心模块的架构设计; 2、主导AI+各类型文件要素提取、结构化体系、审核能力,及对应AI Agent化的技术架构设计,具备高性能、高可用、高可扩展的特性; 3、结合各类型场景涉及到的文件类型,推进AI+文件结构化的类型覆盖与准确率保证工作; 4、参与制定长期技术路线图,推动 AI+文件要素提取在企业经营自动化场景及机器审核等各类场景的支持落地; 职位要求 1、5 年以上后端开发经验,主导过企业级 AI 产品的架构设计; 2、有较强的逻辑能力和规划能力,对 AI Agent 有深度的了解和实践经验; 对前沿技术有好奇心,对 AI 技术发展方向有预判能力; 3、具备较强的自驱力,追求卓越,善于沟通,善于跨团队协作推进事项; 能够推动传统应用架构、基础 Agent 架构向前沿的 AI 应用架构发展和破局; 4、有扎实的后端基础,有大型项目的工程实践经验,精通 Python 或 Java 中至少一门语言; 5、对 AI 应用和 AI 产品有深刻理解,了解大模型的使用边界具备 AI 产品的洞察能力; (加分项); 1、有 AI 领域业务和产品主导能力的优先; 2、有开源项目贡献经验、有 AI 相关专利或论文的优先; 3、深刻理解企业应用设计模式,有大型分布式,高并发,高负载,高可用性系统设计开发经验; 对复杂的服务端系统有构架、经验优化者优先; 4、具备技术团队管理经验者优先; 报名地址详见: 搜索。
0xTodd
1个月前
上次聊过的 Warden 主网正式上线了,这是一条 Cosmos SDK 做的 EVM 兼容链。 有些人可能会问,为什么做 AI Agent 的协议还是需要一条链呢? 在开始之前,想跟大家聊聊 AI 和 AI Agent 的区别究竟在哪? 很多人至今没搞清两者的区别,如果用一个比喻来说,AI 是一个只有大脑的顾问,AI Agent 则是配备了大脑、手脚和工具的员工。 上一代 LLM 基本都是只能算 AI 而不是 Agent,例如 Gemini 1.5 和 GPT-4。它们博学多才,逻辑清晰。但它没有手脚,没有眼睛(如果不接摄像头),不能操作电脑。 所以 AI 的交互是单向的:你问它问题,它给你答案,任务到此结束。 而 AI Agent 会干活。比如说,Warden AI Agent 商店里那些 AI Agent,你连上钱包之后,它真的能给你在 Uniswap 上交易、真的能去跨链。原因就是它有工具,例如浏览器、代码解释器、API 接口。 所以 AI Agent 的交互是闭环的:你给它一个目标,它自己去思考怎么做、去执行、最后给你结果。 比如说,这次测试了一个【定投】的 AI Agent,给它说完要按照每 5 分钟买一次 ETH,在钱包授权了一次之后,它就真的开始哼哧哼哧开始执行了。 PS:你公司聘的究竟是顾问,还是员工,这还是区别蛮大的。 但是像 Gemini 3 + Nano Banana 2 这种,定义界限就有点模糊了,你给它的绘画任务是能完成并交付的,应该算是介于 AI 和 AI Agent 之间。 话说回来,那么 Warden 为什么要专门发个链来做这事儿呢? 就拿刚才的定投例子来说,确实往 Warden 里充了一些钱,但是这个钱包也只能放点零钱,暂时是不敢放大资金的。 因为,如果你让一个在 AWS 服务器上运行的 AI 帮你“用 1000 USDT 买入以太坊”,你完全是在盲信这个服务器的管理员。 你不知道它是否真的按最优价格执行了,还是偷偷夹带了私货(MEV),甚至直接卷款跑路。 Warden 主网的作用,它通过链上共识来验证 AI 的推理结果。 Warden 有一种机制叫 SPEX(统计学执行证明)。 简单来说,它就是让多个节点同时运行或验证这个 AI 任务,链上节点会做随机抽查,并且匹配信誉证明。SPEX 机制相当于某种程度的预言机了。 只有长期得到信任的 AI Agent 大家才会授权给它更多资金,让它做更多事情。 另外,和众多项目上主网的原因一样,Warden 的代币 $Ward 也自然是主网的 GAS 代币以及 AI Agent 支付代币。
宝玉
1个月前
这可能是我写的最“接地气”的 AI 科普:从家政阿姨看懂 Agent 和 MCP 我家请了个家政阿姨打扫卫生,这位阿姨高中毕业,但是经过了家政公司专业训练,学会了该怎么针对不同家庭去打扫卫生,使用各种不同的清洁工具。 当然她不可能记住所有工具的用法,所以额外的,家政公司还给她了一本《家政技能手册》,这个手册有两部分,一部分是目录,不同技能的简要介绍,字数不长,阿姨每次来干活之前都会读一遍目录,以便需要时能想起来; 《家政技能手册》的另一部分是技能的详细介绍,详细介绍里面不仅说明了各种技能的详细做法,有的还有配套的手册,有的还需要借助一些工具。 家政公司还给阿姨配备了一款定制的平板电脑,这个平板电脑支持一种智能家居协议,所有支持这种智能家居协议的家电她都可以用这个平板电脑连上操作。 为了提升效率,家政公司还给她配备了便携式扫地机器人,每次她都开车带上,一些扫地的任务就直接使用扫地机器人。 为了我经常需要阿姨来家里打扫,为了避免麻烦,所以我把我家的一些基本情况写成了说明书,好让阿姨知道该怎么更好的清扫我们家,并且阿姨很专业,每次工作完都写了一份详细的工作记录,这样她下次来还可以看一下以前都做了啥。 虽然有这个说明书,当然每次过来我还是要交代一下:“阿姨,明天我家要开了个 party,客厅一定要弄干净整洁点。” --- 说了这么多我当然不是为了炫耀我家请了个阿姨干活或者帮这家家政公司打广告,而是借这个来“辅助解释”一些常见的 AI 名词。 - 家政阿姨:AI Agent,有基础知识(类似于大语言模型),经过训练,会规划会使用工具 - 扫地机器人:SubAgent,专业的、自主的执行者。 主AI(阿姨)负责委托和监督,机器人(SubAgent)负责具体执行。这大大解放了主AI的精力(上下文窗口),让她可以去干更重要的活。 - 智能家居协议:MCP(模型上下文协议),智能家居协议就是那个家电的统一标准: 支持智能家居协议(MCP 协议)的家电工具阿姨都可以使用。 - 《家政技能手册》:Skills,家政技能手册可以帮助阿姨(Agent)学会她没有被训练过的技能,而且这些技能是“动态加载”和“渐进式披露”的。 “动态加载”的意思是:阿姨只有在需要用特定技能的时候,才会去《家政技能手册》翻该技能的详细内容。 “渐进式披露”的意思更进一步:阿姨不会一开始就把整本手册都读完,她干活前先看一眼目录(元数据,大约 100 个词),“哦,这个技能跟我现在的任务有关”。然后它再打开读具体章节(完整的指令,小于 5000 词)。 这有什么好处?省脑子(省上下文窗口)。 确保阿姨总是在最需要的时候,用最少的“脑力”获取最关键的专业知识。 - 我家:Project,存放了与我家相关的说明书、历史信息。 希望上面这个比喻能帮助你更好的理解这些概念。 ⚠️ 需要注意的是,这些比喻只是帮助你理解这些概念,并不能代替你深入的去学习和理解这些知识。
宝玉
1个月前
我家请了个家政阿姨打扫卫生,这位阿姨高中毕业,但是经过了家政公司专业训练,学会了该怎么针对不同家庭去打扫卫生,使用各种不同的清洁工具。 当然她不可能记住所有工具的用法,所以额外的,家政公司还给她了一本《家政技能手册》,这个手册有两部分,一部分是目录,不同技能的简要介绍,字数不长,阿姨每次来干活之前都会读一遍目录,以便需要时能想起来; 《家政技能手册》的另一部分是技能的详细介绍,详细介绍里面不仅说明了各种技能的详细做法,有的还有配套的手册,有的还需要借助一些工具。 家政公司还给阿姨配备了一款定制的平板电脑,这个平板电脑支持一种智能家居协议,所有支持这种智能家居协议的家电她都可以用这个平板电脑连上操作。 为了提升效率,家政公司还给她配备了便携式扫地机器人,每次她都开车带上,一些扫地的任务就直接使用扫地机器人。 为了我经常需要阿姨来家里打扫,为了避免麻烦,所以我把我家的一些基本情况写成了说明书,好让阿姨知道该怎么更好的清扫我们家,并且阿姨很专业,每次工作完都写了一份详细的工作记录,这样她下次来还可以看一下以前都做了啥。 虽然有这个说明书,当然每次过来我还是要交代一下:“阿姨,明天我家要开了个 party,客厅一定要弄干净整洁点。” --- 说了这么多我当然不是为了炫耀我家请了个阿姨干活或者帮这家家政公司打广告,而是借这个来“辅助解释”一些常见的 AI 名词。 - 家政阿姨:AI Agent,有基础知识(类似于大语言模型),经过训练,会规划会使用工具 - 扫地机器人:SubAgent,专业的、自主的执行者。 主AI(阿姨)负责委托和监督,机器人(SubAgent)负责具体执行。这大大解放了主AI的精力(上下文窗口),让她可以去干更重要的活。 - 智能家居协议:MCP(模型上下文协议),智能家居协议就是那个家电的统一标准: 支持智能家居协议(MCP 协议)的家电工具阿姨都可以使用。 - 《家政技能手册》:Skills,家政技能手册可以帮助阿姨(Agent)学会她没有被训练过的技能,而且这些技能是“动态加载”和“渐进式披露”的。 “动态加载”的意思是:阿姨只有在需要用特定技能的时候,才会去《家政技能手册》翻该技能的详细内容。 “渐进式披露”的意思更进一步:阿姨不会一开始就把整本手册都读完,她干活前先看一眼目录(元数据,大约 100 个词),“哦,这个技能跟我现在的任务有关”。然后它再打开读具体章节(完整的指令,小于 5000 词)。 这有什么好处?省脑子(省上下文窗口)。 确保阿姨总是在最需要的时候,用最少的“脑力”获取最关键的专业知识。 - 我家:Project,存放了与我家相关的说明书、历史信息。 希望上面这个比喻能帮助你更好的理解这些概念。 ⚠️ 需要注意的是,这些比喻只是帮助你理解这些概念,并不能代替你深入的去学习和理解这些知识。
错过了 x402 的热潮?别再错过 ERC-8004。 短短几周内,x402 以 “AI Agent能自主支付” 的概念席卷了整个加密圈。 它让机器第一次真正参与经济活动——能为服务付费,也能从交互中获利。 但在支付之外,更关键的问题随之而来: 当无数AI Agent开始彼此调用、交易、合作,它们如何确认对方是谁、是否可信、结果是否真实? 这正是 ERC-8004 诞生的背景。 这个由以太坊基金会、MetaMask、Google 与 Coinbase 工程师共同提出的标准, 正在为Agent Economy补上缺失的那一层:信任层(Trust Layer)。 ERC-8004 的核心机制 ERC-8004 也被称为 “无信任智能体(Trustless Agents)” 标准。 它与 x402 一样,都是构建 AI 经济基础设施的关键拼图: x402 让价值可以流动,而 ERC-8004 让流动变得可信。 它由三项机制组成: - 身份注册(Identity Registry):为每个 Agent 创建可验证的链上身份与元数据。 - 信誉记录(Reputation Registry):每次交互都会留下公开的表现与反馈,形成可追踪的信誉曲线。 - 结果验证(Validation Registry):通过加密证明或第三方审计,确保输出结果真实可验证。 换句话说,ERC-8004 把“信任”从主观判断转化为可被代码读取的数据结构。 重构AI Agent的信任体系 今天的 AI 服务依然依赖中心化平台。 算法、信誉、流量都掌握在少数公司手中。 ERC-8004 则将这些核心要素迁移到链上,让Agent拥有独立的身份与历史记录。 这意味着: 信誉不再属于平台,而属于Agent本身; 表现优秀的 Agent 可以在不同网络中自由流通; 信任成为开放市场中的可定价资源。 当信誉与验证数据都公开后,可靠性本身就能被定价。 好的Agent获得更多调用与收益,失信的则失去交易机会。 这让Agent市场第一次具备了“优胜劣汰”的经济逻辑。 x402 与 ERC-8004 是同一体系的两极: 一个让机器能“付钱”,一个让机器“值得被信任”。 两者共同形成一个自我强化的经济循环: Agent 通过 x402 完成支付; 执行结果经 ERC-8004 验证并上链; 信誉记录自动更新; 价格与优先级据此动态调整。 这不仅让机器之间能合作,更让合作具备市场意义—— 激励、信任、竞争首次在 AI 层实现自治。 正在形成的生态版图 围绕 x402 与 ERC-8004,一个以「支付与信任」为核心的Agent生态正在加速成形。 它大致可以分为三个层次: 1. 基础设施层 以 EigenLayer、Base、Taiko、Phala Network、Celestia 等项目为代表, 它们提供算力、验证与数据可用性, 为Agent的安全运行和交互提供底层支撑。 2. 中间协议层 包括 OpenServ、Unibase、S.A.N.T.A、Bittensor、、SingularityNET 等协议, 负责Agent之间的通信、索引、结算与激励机制, 相当于连接底层链与上层应用的“中枢神经系统”。 3. 应用层 这一层是Agent真正进入市场、创造价值的地方。 例如 Virtuals Protocol、Praxis、Kaito、MyShell 等团队, 正在把交易、数据分析、内容生成等场景变成可调用的Agent服务。 而在这一层中,Hubble 正在构建关键基础设施。 我们将 x402 的支付机制 与 ERC-8004 的信任模型 相结合, 把链上数据、研究逻辑和交易策略封装成可验证的 Agent Marketplace。 通过这一市场,Agent之间能以“真实交易、实时验证”的方式运行, 让信任与价值循环在实际市场中被验证。 结语 ERC-8004 让信任第一次拥有了结构化的形式。 当它与 x402 一起运转,AI Agent不再只是算法模型, 而成为具备身份、信誉与收益能力的独立经济个体。 在未来的网络中, 不仅人类在交易,Agent之间也会因信誉而竞争。 这,才是AI Agent时代真正的开始。
这两天x402大火,带火了#Ping,#PayAI 等标的的同时,也唤起了我的一些远古+近期记忆 x402从定义上来讲,是Agent之间基于Crypto的支付协议。从具体场景来说,主要就是Agent之间的微支付/按需支付 殊不知微支付/按需支付这个东西,币圈不是第一次搞,而是第N次了 远古记忆 1. 09-10年 BTC - 中本聪最早在Bitcointalk论坛曾经讨论过微支付的事情,他认为比特币当时的技术限制不适合极小额支付,但将来随着技术的发展有可能实现(毕竟当初他设计BTC的时候是一个Cash System,不是价值存储) 2. 17-18年 闪电网络 - 理论上来说,状态通道这个东西最适合微支付,多小额都可以,且TPS理论上无限,但是一直就是做不起来。 Nano/IOTA - 两个用了有向无环图技术的项目,一个主打日常高性能支付链,一个主打物联网机器之间的支付协议,现在也都化石了 3. 19-20年 BSV - BSV想过把BTC微支付那个概念实现,当时设计了超大区块,0确认,IP直塞能各种Fancy的技术,也确实有视频流支付项目基于其做出来了(看付费视频看到哪支付到哪,边看边支付),但这个场景其实对我们人类来说相对鸡肋 近期记忆 23年6月,ABCDE团队在巴厘岛聚会,当时正值一级市场AI项目被GPT火爆带的井喷。记得Party前在泳池边跟当天最后一个国内的AI项目视频聊完,当时有段对话让我印象极其深刻 - “区块链或者说智能合约这个东西发明出来,其本质不是给人用的,而是给AI用的” 最终这个项目没投,2年多过去不知道他们发展的怎样,希望有在继续坚持。但当时确实ABCDE团队非常Buy In这个Theory,后来24年我们投了一个AI项目,很大程度上也是看中项目对Agent 2 Agent支付这个赛道的理解以及Road Map上对这个赛道的切入 这一切都发生在x402诞生之前,属于混沌期。现在有了x402,加上最近Ping 和 PayAI的爆火,Agent Payfi甚至未来AI时代的支付蓝图终于变得明朗和清晰起来 所以有时候东西做的太早,容易成为先烈而不是先锋。微支付/按需支付这个领域,多年探索,无数失败后终于发现,原来不是场景不对,而是主体不对。人与人之间是不需要微支付的,机器与机器,或者说Agent与Agent之间才是它真正大施拳脚的舞台。 这也许就是大家常说的 - 快人一步吃肉,快人十步吃屎
meng shao
2个月前
三十年前,加州尔湾大学的实验室里,Roy Fielding 在 HTTP 协议中埋下了402 状态码这个孤独的彩蛋,期待着一个“按需付费”的互联网未来。 依照他的设想,用户可以为一篇文章付几分钱,为一张图片付几美分,支付会像“ TCP/IP ”握手一样自然地发生在后台。 但在那个互联网狂飙突进年代,这种设想却注定无处生根: 高昂的交易成本让微支付沦为笑话,割裂的用户体验让每次付费都备受折磨,空白的技术基础让这一切只能停留在纸面.....当然,最关键的是,互联网高速增长的20年,“免费”才是主旋律。 于是,Roy Fielding当初那个浪漫的设想被压垮了,HTTP 402 也沉睡了三十年,像一段被遗忘的注脚。 然而,三十年后,“互联网、AI、区块链、MEME”在某个拐角处神奇地相遇了,并产生了不可思议的化学反应。 -AI Agent带来了原子化消费范式,它不需要订阅,不需要广告,只需要 xxxx美元的每一次API调用; -区块链饱和的infra提供了即时结算能力,它让毫秒级的微支付、高频、低成本交易具备了可行性; -MEME给出了爆炸性的病毒传播,让人人如饥似渴般学习x402技术及背后的生态; 重点来了! x402 协议正好把这四股力量拧成了一股绳。把互联网需求和区块链infra能力原本两个平行的世界,焊接到了一起! 这不仅改变了传统的复杂支付范式,还迎合了稳定币大潮下,传统金融和加密资产汇流的大趋势。 想想看,当支付不再需要跳转和确认,当区块链成为互联网协议层原生能力的一部分,当 AI Agent可以像呼吸一样完成千万笔微支付。最关键的是,AI LLMs的到处猎取数据,即将彻底破坏传统互联网的“广告”商业模式。 需要发起一场“按需付费”革命! So,这种种因素叠加下,Roy Fielding那个三十年前被雪藏的“付费”梦想,终于可以搬上台桌重生了。 HTTP 402,那个孤独了三十年的状态码,也终于等来了属于它的x402时代。